Large language model scoring of medical student reflection essays: Accuracy and reproducibility of prompt-model variations
该研究评估了多种提示策略和模型变体对医学生反思作文的评分表现,发现大多数大语言模型配置均能达到近乎完美的人机评分一致性与可重复性,其中微调模型和包含示例的提示在精度上更优,而 GPT-4.1-mini 则在低成本下提供了良好的评分效果。
22 篇论文
该研究评估了多种提示策略和模型变体对医学生反思作文的评分表现,发现大多数大语言模型配置均能达到近乎完美的人机评分一致性与可重复性,其中微调模型和包含示例的提示在精度上更优,而 GPT-4.1-mini 则在低成本下提供了良好的评分效果。
本文介绍了 PRIME-CVD,这是一个专为心血管风险建模教育设计的参数化合成医疗环境,它基于公开统计数据生成包含 5 万名成年人的两类数据集,在确保零隐私泄露风险的同时,为医学教学提供了涵盖数据清洗、因果推理及风险建模的逼真且可复现的训练资源。
这项针对摩洛哥拉巴特医学院的横断面研究表明,尽管学生英语能力存在差异,但绝大多数医学生对采用英语作为教学媒介持高度积极态度,且高年级、学习兴趣及认为英语应作为高等教育语言的信念是支持该举措的关键预测因素。
这项基于加拿大农村医疗团队的研究引入了“可塑性”概念,揭示了医护人员通过灵活的角色转换应对资源匮乏的双重性:这种适应性既是维持社区医疗的韧性来源,也因长期缺乏制度支持而加剧了职业倦怠。
本文提出了一种基于无代码可视化编辑器和本地开源大语言模型的 AI 辅助网络框架,旨在通过要求学习者在分支临床场景中提供并实时评估决策理由,来解决医疗教育中 AI 技能更新滞后及传统考核重模式识别轻逻辑推理的问题,从而构建可扩展的专家主导型 AI 微认证体系。
这项针对美国大学学术院长和系主任的多机构调查揭示了新冠疫情前后医师科学家招聘与留任实践的变化,指出私立机构在启动资金和育儿政策方面更具优势,而疫情导致补充资金减少并迫使初级教员增加临床工作量,强调提高招聘透明度对于改善医师科学家职业路径和减少人才流失至关重要。
这项在马里巴马科开展的研究评估了为期五天的混合式研讨会对15至24岁青年生殖器衣原体相关知识、态度和行为的影响,结果显示该干预显著提升了参与者对并发症的认知、伴侣间关于性传播感染状况的沟通意愿以及筛查接受度,但伴侣间的信息分享仍显不足,表明需要持续的教育干预。
这项针对阿联酋医学本科生的机器学习研究通过贝叶斯网络等模型分析发现,高中课程类型本身并非预测毕业成功的关键因素,而在校期间的累计平均绩点(GPA)才是最重要的预测指标。
该研究评估了基于 LLaMA-3.1 的 AI 系统在生成家庭医学居民科研项目反馈方面的表现,发现虽然人类专家在整体质量上仍占优势,但 AI 在特定项目类型(如基于调查的研究)和安全性评估方面已能媲美甚至在某些指标上超越人类专家,表明开源大模型结合精心设计的提示词具备规模化生成高质量反馈的潜力。
这项针对美国所有认证医学院的横断面网络审计研究发现,虽然学生科研项目已普遍设立,但其结构、期望和支持体系存在显著差异,且研究型大学和顶尖院校往往在外部资金、项目时长及强制性要求方面表现更为突出。
这项针对非洲多国临床协调员的研究表明,基于慕课(Moodle)的10周结构化、能力本位培训显著提升了参与者在试验管理、项目与财务等关键领域的核心能力,证明了此类国际认证培训对加强非洲临床试验质量与科研能力的重要性。
本研究方案旨在通过在瑞士应用科学大学开展一项随机可行性对照试验,评估在物理治疗本科课程中实施包含个人辅导、团体辅导及对照组的程序化评估(PA)的可行性及其对学习者能力发展的教育影响。
这项针对急诊和急症护理领域高级执业提供者(APPs)的横断面研究初步验证了一种新的认知评估工具,并发现结果导向型思维与较低的倦怠感和较高的职业满足感显著相关,而问题导向型思维则与倦怠感呈正相关。
这项针对加州大学旧金山分校艾滋病研究中心多组件职业导师项目的评估显示,该补充性导师计划显著提升了早期阶段研究人员的职业轨迹,但同时也揭示了在支持少数族裔研究者应对结构性障碍方面仍需加强。
该研究开发并验证了 CPX-MATE 这一端到端医学教育平台,该平台通过集成语音驱动的虚拟患者模拟与基于大语言模型的实时自动评估系统,在急诊医学轮转中成功实现了高保真的人机对话交互、与人类评分高度一致的自动化考核反馈,并展现出良好的可用性与成本效益。
这项针对尼日尼亚医学生的随机对照试验表明,在记忆回忆和问题解决任务中,具有文化熟悉度的伊博高生活音乐(Igbo Highlife)比西方古典音乐或静默环境更能显著提升认知表现。
这项准实验研究表明,在医师助理教育中,团队式学习(TBL)在提升胸部 X 光片解读的学术成绩方面与传统讲授法效果相当,但在增强学生参与度、同伴互动及自我效能感方面表现更优。
布隆迪大学医学院在缺乏尸体解剖资源的情况下,通过结合讲座与包含 3D 模型、虚拟应用等多种数字工具的混合教学模式,成功实现了高效的人体解剖学教学,并获得了学生的高度认可。
这项在乌干达坎帕拉针对 41 名护理学员开展的前后对照准实验研究表明,实施 therapeutic communication(治疗性沟通)教育模块能显著提升学员在该领域的知识水平、自信心及临床实践能力。
本文提出了一种将第三年医学生轮转分配建模为线性求和优化问题的非随机匹配算法,旨在通过最小化成本来优化岗位分配,从而更好地契合学生的兴趣与职业目标并提升其学习效果。